专利摘要:
方法は、まず格子グラフを構築することによって入力画像をサイズ変更する。格子グラフは、入力画像内の画素毎に1つのノードを含み、格子グラフ内の隣接するノードは、アークによって連結される。各アークは有向であり、関連付けられるコストを有する。コスト関数を使用して格子グラフのアークに切断を適用する。シーム内の画素の座標が単調性制約条件および連結性制約条件を施行するように、切断から画素のシームを決定する。次に、入力画像と比較されるときの、出力画像内のエネルギー変化を最小にしながら、シームに従って入力画像をサイズ変更して出力画像を生成する。
公开号:JP2011505631A
申请号:JP2010536051
申请日:2008-11-12
公开日:2011-02-24
发明作者:アビダン、シュミュエル;シャミル、アリエル;ブランド、マッシュー・イー;ルビンスタイン、マイケル
申请人:ミツビシ・エレクトリック・リサーチ・ラボラトリーズ・インコーポレイテッド;
IPC主号:G06T11-20
专利说明:

[0001] 本発明は、包括的には画像処理に関し、より詳細には画像およびビデオをサイズ変更することに関する。]
[0002] [関連出願]
本出願は、2007年11月29日付けで出願された、米国仮特許出願第60/990,964号「Retargeting Images Using Graph Cuts」、および、2007年11月30日付けで出願された、米国仮特許出願第60/991,361号「Seam Carving for Content-Aware Video Resizing」に対して優先権を主張し、これらの仮特許出願の双方が、参照によりそれらの全体が援用される。]
背景技術

[0003] シームカービングは、コンテンツを意識した画像サイズ変更のための効果的な技法である。画像を、異なる縦横比または異なる解像度を有する表示装置のためにサイズ変更する必要がある場合がある。同様にして、ビデオを、該ビデオの縦横比、解像度、期間の任意の組み合わせを変更することによって、テレビ、コンピュータ端末、セルラ電話、および他の携帯表示装置のためにサイズ変更することが可能でなくてはならない。]
[0004] シームカービングのビデオへの単純な拡張は、各ビデオフレームを画像として扱い、各フレームを他のフレームから独立してサイズ変更することである。しかしながら、これによって、時間的一貫性がないことに起因するジッタによるアーチファクトが生じる。]
[0005] 従来のシームカービングは、他の制限も有する。顕著な空間構造が現れる画像において、シームカービングは、厄介なアーチファクトを生成し得る。これらのアーチファクトは、空間アーチファクトが時間アーチファクトによって増幅および増大され得るビデオにおいて、より大きなものとなる。実際、人間の目は、動きに対して高感度であるため、人間の知覚の働き方に起因して、時間アーチファクトは、ビデオにおいて、より一層邪魔なものとなる場合がある。]
[0006] 画像およびビデオのサイズ変更に関して、多数の方法および技法が既知である。画像およびビデオ内の対象領域(ROI)を検出するために、人間の時空間知覚に基づく注意モデルが使用されてきた。そして、ROIは、表示サイズがビデオ(または画像)サイズよりも小さい装置上で使用される表示パスを画定するために使用される。ビデオの最も重要度が低いコンテンツは、クロッピングされ、重要な特徴は、より大きなスケールに残され、実質的にズームインのような効果が生じる。]
[0007] 視覚的に快い方式でコンテンツを提示するために、仮想カメラの動きまたは擬似ズームイン/ズームアウト効果が使用されてきた。同様に、ワイドスクリーンの長編映画およびDVDを標準のテレビフォーマットに適合させるプロセスを模倣するために、仮想カメラの動きとともに、クロッピングおよびスケーリングの双方が使用されてきた。1つのシステムは、画像内のオブジェクト、および検出されるオブジェクト、たとえば顔に基づいて情報損失を最小にする。しかしながら、クロッピングは、大量の情報を廃棄し、たとえば、重要な特徴がビデオフレームのエッジ付近に位置する場合(これは、2人の役者間の対話を撮影するために通常行われるようなワイドショットまたは肩越しショットにおいて一般的である)に問題となり得る。]
[0008] 代替的な手法は、画像を背景レイヤおよび前景レイヤに区分けし、各レイヤを独立してスケーリングする。次に、それらのレイヤを再結合して、サイズ変更された画像を生成する。この技法は、区分けの品質に決定的に依存するが、区分けは、それ自体、困難で複雑なタスクである。]
[0009] 別の方法は、オブジェクトべースである。入力ビデオを、複数のオブジェクトおよび複数の動作に区分けする。次に、区分けされたオブジェクトから短いビデオ概要を構成することができる。この方法は、ビデオのリタイミングしか扱わず、ビデオの空間広がりを変更しない。]
[0010] 別の方法は、不均一な大域ワーピングを使用し、空間エッジ、顔検出、および動き検出を含む、ビデオに関する効果的な顕著性マップを定義することに的を絞っている。]
[0011] 代替的な手法は、2D多様体を、新たなビデオシーケンス内のフレームにマッピングする。進化時間フロント(Evolving Time Fronts)と呼ばれるこの手法によって、動的ビデオシーンにおいて時間を操作することが可能になる。]
[0012] グラフ分割およびグラフベースのコスト最小化技法は、画像復元、画像区分け、オブジェクト認識、および形状再構築のような、画像処理用途およびビデオ処理用途において、広く使用されている。画像を表すグラフは、類似度測定および制約条件に基づいて、2つの別個のサブセットに分割される。1つの方法は、グラフ切断を使用して、2Dテクスチャまたは3Dテクスチャを画像内にパッチする。]
[0013] 本発明の実施の形態は、コンテンツを意識して画像およびビデオをサイズ変更するための方法およびシステムを提供する。本方法は、2D画像に対し、1D画素シームを除去または挿入し、ビデオのような3D時空間ボリュームに対し、2D多様体を除去または挿入する。]
[0014] 本発明は、3Dボリュームに適したグラフ切断を使用する。格子グラフにおいて、入力画像内の画素を表すノードは、有向アークによって連結される。この定式化において、シームは、格子グラフ内のアークに対する、結果としてのシーム内の画素が単調であり、かつ連結された、すなわち、直接隣接しているような切断によって画定される。]
[0015] さらに、本発明は、サイズ変更された画像およびビデオの視覚的品質(見栄え)を改良するエネルギー関数を提供する。本発明は、前方エネルギーを使用し、入力画像にシームを適用して、入力画像と比較した出力画像におけるエネルギー変化(ΔE)が最小になるように、出力画像を生成する。]
[0016] この判断基準は、以下のように表すことができる。]
[0017] ]
[0018] ただし、Eはエネルギー関数、たとえば画素単位の濃度差であり、IIは入力画像であり、IOは出力画像であり、Ciは関連付けられるコストを有する画素のシームである。]
発明の効果

[0019] 本発明では、画像およびビデオをサイズ変更するための、改良型シームカービング演算を提供する。ビデオのサイズ変更は、グラフ切断を使用して達成される。本発明では、入力画像ではなく、出力画像に対するシームカービングの効果を測定する前進的なエネルギー関数も提供する。]
[0020] 本発明によるエネルギー測定を、グラフ切断または動的プログラミングのいずれかによって使用することができる。1つの方法は、ビデオを時間的にサイズ変更するようになっていることもできる。ビデオボリュームをY×Tビューに回転することによって、時間領域を通って切断するシーム多様体を見つけることができる。これらの多様体は、除去されると、ビデオの長さを減少させる。]
図面の簡単な説明

[0021] 本発明の1つの実施の形態による、コンテンツを意識して画像をサイズ変更するための方法のフロー図である。
異なる複数の格子グラフ構築に関するシームを含む、入力画像例である。
図2のシームに関する画像分割および対応する格子グラフのブロック図である。
図2のシームに関する画像分割および対応する格子グラフのブロック図である。
図2のシームに関する画像分割および対応する格子グラフのブロック図である。
図2のシームに関する画像分割および対応する格子グラフのブロック図である。
本発明の実施の形態による格子グラフのブロック図である。
本発明の実施の形態によるグラフ切断の概略図である。
時空間ビデオボリューム、および2D多様体を形成するシームのブロック図である。
除去されるシームの関数としての出力画像におけるエネルギー変化のグラフである。
垂直シームのための3つの可能な方向を示す図である。
ある入力画像に関して、従来技術の出力画像を、本発明の1つの実施の形態による、入力画像から得られる出力画像と比較する図である。
従来技術のシームを有する画像、および本発明の1つの実施の形態によるシームを有する画像を示す図である。
図9(A)(B)に対応するエネルギー画像を示す図である。] 図2 図9
実施例

[0022] 本発明の実施の形態は、グラフ切断から得られる画素のシームを使用して、画像およびビデオをサイズ変更するための方法を提供する。本明細書において定義されるように、「シーム」は、単調であり、かつ連結された画素のパスであって、画像の上端から反対側の下端まで延びるか、または代替的には左端から反対側の右端まで延びる。ビデオ、すなわち画像の時間シーケンスの場合、シームは、時間次元内の2D多様体とすることができる。1つのシームを除去または挿入することによって、画像のサイズは、水平方向、垂直方向、または時間次元において1画素だけ低減または増加される。所望のサイズの出力画像を生成するために、シームを繰り返し除去または挿入することができる。]
[0023] ビデオにおいて、フレームシーケンス内の2Dシーム(多様体)を決定する。出力画像のサイズを増加若しくは減少させるため、または入力画像内の特定の部分を除去してオブジェクト除去をもたらすために、シームを繰り返し適用することができる。入力画像のサイズは、シームの画素を複製し、サイズ変更された画素を任意選択で出力画像内に混合することによって増加させることができる。]
[0024] いくつかの実施の形態では、画像内のエネルギーは、画素強度、色、またはビデオの場合は、動きに関連付けられる。画像内のエネルギーは、エネルギー関数に従って求めることができる。本明細書において説明されるように、たとえば、エネルギー関数は、強度、輝度、色、明白な動き、および類像性(iconicity)の局所的な変化を含む、局所顕著性の測定値を考慮することができる。]
[0025] 本発明では、有向アークによって連結されるノードからなる格子グラフを構築する。入力画像内の画素毎に1つのノードが存在し、有向アークは、画素のエネルギーに基づいてコストを割り当てられる。下記でより詳細に説明されるように、無限のコストを有する有向アークを使用して、単調性制約条件および連結性制約条件を施行する。]
[0026] 代替的に、ビデオフレーム内の重要度が低い領域を検索する。これは、各フレームにおけるエネルギー関数を独立して評価し、次に、各画素位置において最大エネルギーをとることによって行われる。このエネルギーを使用して、全てのフレームをサイズ変更する。この静的方法によって決定されるシームを「静的」シームと呼ぶ。これは、これらのシームがフレーム間で経時的に変化しないためである。]
[0027] 2007年3月6日にAvidan他によって出願され、これもMitsubishi Electric Research Laboratories社に譲渡された、本発明者らの以前の米国特許出願である、米国特許出願第11/682,521号明細書「Method for Retargeting Images」において、動的プログラミングを使用して、入力画像から最小コストシームを除去した、コンテンツベースの画像再構成(retargeting)方法が説明されている。しかしながら、出力画像によっては、依然として厄介なアーチファクトを有していた。本発明者らは、これらのアーチファクトは、サイズ変更された出力画像のエネルギーに対する、シーム除去の影響を考慮しなかったために発生したと認識している。本発明者らの以前の研究では、シーム除去に起因する入力画像内のエネルギー、すなわち後方エネルギーの変化を最小にした。今回、本発明では、出力画像内のエネルギー、すなわち前方エネルギーの変化を最小にする。本発明者らの以前の方法は、ビデオをサイズ変更するのに実用的ではなかったことも本発明者らは認識している。]
[0028] 本発明は、これらの問題に、以前のような動的プログラミングの代わりに、多次元格子グラフに対する切断を使用して対処する。さらに、最小コストシームを除去する代わりに、ここでは、入力画像と比較されるときの、サイズ変更された出力画像におけるエネルギー変化を最小にする。]
[0029] 本発明では、入力ビデオを画像の3Dボリューム(時間的に配列されたフレームシーケンス)として扱い、シームカービングを、2D画像上の1Dシームから、3Dボリューム上の2D多様体に拡張する。多様体と各フレームとの共通部分は、フレーム上のシームを画定する。多様体は、サイズ変更された出力ビデオ内の空間アーチファクトおよび時間アーチファクトの双方を大幅に低減する前方エネルギー関数を使用して見つけられる。本発明では、3D時空間ボリュームを通じて2D連結多様体103を構築するため、Avidan他による画像サイズ変更に使用される動的プログラミング手法は可能でない。したがって、本発明による方法は、グラフ切断を使用する。]
[0030] しかしながら、従来のグラフ切断は、本発明による新規の単調性制約条件および連結性制約条件下で、常に有効なシームを画定するとは限らない。]
[0031] 本発明では、単調であり、かつ連結したシームを生成する新規なグラフ切断を定義する。これは、シームが幅1画素であり、シーム内の画素が連結されている、すなわち水平方向または垂直方向のいずれかにおいて直接隣接していることを意味する。この定義を使用して、本発明では、シームカービングをビデオに適用し、ビデオボリュームを通る、単調であり、かつ連結した2D多様体シームを画定する。ビデオをサイズ変更するための処理時間を減少させるマルチ解像度手法も説明する。]
[0032] さらに、顕著な空間コンテンツおよび時間コンテンツを、より良好に保護するシームカービング判断基準も定義する。これによって、本発明によるサイズ変更された画像およびビデオの視覚的品質が大幅に改良される。新たな判断基準は、従来技術におけるように除去または挿入されるシームのコストではなく、サイズ変更された画像におけるエネルギー変化を最小にする。]
[0033] 前方エネルギー変化の最小化
エネルギー変化を最小にする上記の判断基準は、以下のように表すことができる。]
[0034] ]
[0035] ただし、Eはエネルギー関数(たとえば画素単位の強度差)であり、IIは入力画像であり、IOは出力画像であり、Ciは関連付けられるコストを有する画素のシームである。]
[0036] ビデオサイズ変更
シームカービングを使用するビデオサイズ変更によって課される問題は、手順上の問題、次元の問題、基本的な問題として特徴付けることができる。]
[0037] 手順上の問題は、Avidan他の従来技術の動的プログラミング方法を3Dビデオボリュームに直接拡張することができないということから起こる。]
[0038] 次元の問題は、ビデオの追加の時間次元から発生する。ビデオの追加の時間次元によって、空間アーチファクトが増加し、動きに関連するアーチファクトがもたらされる。]
[0039] 基本的な問題は、ビデオがフレームシーケンスであり、したがって、ビデオシーケンスのいかなる処理も、大量のデータを伴うということが原因である。たとえば、ビデオ全体に必要とされるデータをランダムアクセスメモリ内に格納することはできない。したがって、これらのデータは、ディスク上に格納され、出力フレームがレンダリングされる前に要求に応じてロードされる。]
[0040] 本発明では、これらの問題に対処し、サイズ低減およびサイズ拡張のようなビデオサイズ変更アプリケーション、対話型のサイズ操作のためのマルチサイズビデオ、ならびにオブジェクト除去を説明する。]
[0041] 操作方法
図1は、本発明の1つの実施の形態による方法のステップを示している。入力画像101、またはビデオの場合は画像シーケンス(フレーム)から格子グラフ111を構築する(110)。単一の画像の場合、格子グラフは(X,Y)平面内で2次元であり、ビデオにおけるような画像シーケンスの場合、格子グラフは3次元ボリューム(X,Y,T)である。] 図1
[0042] 格子グラフは、各画像内の画素毎に1つのノードを含む。格子グラフ内の隣接するノードは、有向アーク112によって連結されている。有向アークは、水平方向に前方および後方に、垂直方向に上および下に、ならびに対角線方向に後方に延びる。]
[0043] エネルギー関数E(f)を使用して、格子グラフ111においてアーク112にコストを割り当てる(120)。入力画像に対してエネルギー関数を計算する。コストを使用してコスト行列またはコストマップ121を構築することができる。コスト行列またはコストマップ121は、画像内の大域エネルギーを実質的に反映する。1つの画像の場合、コストマップは(X,Y)平面内にある。ビデオの場合、コストマップは(X,T)平面内または(Y,T)平面内のいずれかにあり得る。隣接するノードを連結する有向アークにコストを割り当てる。好ましい実施の形態では、コストは、入力画像内の隣接する画素間の強度の勾配量に基づく。すなわち、コストは、隣接するノードを連結するアークに対して定義される。]
[0044] アークを、コストマップMを使用してコスト関数132に従って切断する(400)。切断部の一方の側に隣接するノードに対応する画素は、シームを形成する。各シーム内の画素の座標は、単調性制約条件および連結性制約条件を施行する。アークにおけるコストによって施行される制約条件については、下記でより詳細に説明する。]
[0045] 次に、シーム400に従って、入力画像101をサイズ変更して(140)、出力画像104を生成する。これは、出力画像において、入力画像からの顕著な視覚的コンテンツを保持しながら、入力画像に対する出力画像のエネルギー変化を最小にするように行われる。サイズ変更によって画素を付加または除去することができる。次に、出力画像をレンダリングするか、格納するか、通信するか、またはさらに処理する(150)ことができる。]
[0046] 以下の方法を、静的カメラを用いて取得されるビデオに適用することができる。一般的なビデオに関しては、下記で説明されるグラフ切断ベースのシームによる方法を参照されたい。]
[0047] N個のフレームからなるビデオシーケンスにおいて、各フレームは、水平座標i、垂直座標j、時間ステップt(フレーム)の場合に、{It(i,j)}個の画素を有する、ただしt=1〜Nである。1つの実施の形態では、エネルギー関数は、L1ノルムに基づく。L1ノルムの場合、2つの隣接する画素間のアークのコストは、それらの強度(エネルギー)の絶対差の合計である。L1ノルムは、直線距離、街区距離、またはマンハッタン距離としても既知である。]
[0048] 本発明では、空間L1ノルム勾配量エネルギーEspatialを、時間勾配量エネルギーEtemporalと結合して、以下のように時空間L1ノルム勾配量エネルギーEglobalを生成する。]
[0049] ]
[0050] ただし、α∈[0,1]である。]
[0051] ビデオの場合、エネルギー測定は、空間L1ノルム勾配量エネルギーの、2Dへの最大(max)投射である。ただし、αは空間エネルギー寄与と時間エネルギー寄与とを平衡させるパラメータである。実際には、動きアーチファクトは、より目立つため、エネルギーを時間重要性にバイアスし、たとえばα=0.3とする。本発明によるエネルギー計算においては控えめに、平均ではなく最大投影を使用する。]
[0052] 利点として、本発明による静的方法は、単純かつ高速である。本方法は、ビデオが固定カメラによって取得され、前景および背景が容易に特定されるときに良好な結果を与える。しかしながら、より複雑なシーンのビデオ、またはカメラが動いているか若しくは複数の動きが存在するビデオでは、本発明によるシームは時間にわたって動的に適合することができる。]
[0053] このために、本発明では、ビデオシームを、3Dビデオボリュームを通って「切断する」、時空間における連結された2D多様体として定義する。表面と各フレームとの共通部分は、フレーム内の1つのシームを画定する。このため、この多様体の1つのシームを各ビデオフレームから除去する。多様体は連結されているため、シームはビデオの時間的一貫性を保持する。]
[0054] グラフ切断を使用するシームカービング
まず、本発明によるシームカービングの一般的な定式化を、画像におけるグラフ切断問題として説明した。そして、次に、シームカービングをビデオに拡張する。この説明を単純にするために、画像内の垂直シームを検索する。水平シームの場合、全てのグラフ構造は同じであり、適切に90度回転される。]
[0055] 図3A〜図3Eに示すように、格子グラフ内のノードは、有向アークによって連結される。入力画像101から格子グラフを構築し、ここで全てのノード301が画素pi,jを表す。グラフ302内の直接隣接するノードは、アーク302によって連結される。図3A〜図3Eを参照されたい。] 図3A 図3B 図3C 図3D 図3E
[0056] 視覚的な終端ノードS(ソース)およびT(ターゲット)は、水平シームの場合、画像の左端列および右端列の画素に対応し、垂直シームの場合、上端行および下端行に対応するエッジノードに対応する全てのエッジノードに、無限の(∞)コストアークを連結することによってグラフ内に構築される。終端ノードは、グラフのエッジおよび画像における動かせない「アンカー」として機能する。]
[0057] 本明細書において定義されるように、切断部は、格子グラフの1つのエッジから、格子グラフの真向かいのエッジに延在する。このため、格子グラフにおけるソースからターゲットへの(S/T)切断、または単に「切断」C400は、グラフ内のノード(およびノードによって表される対応する画素)を、s∈Sかつt∈Tとなるように2つの別個のサブセットS311およびT312に分割することとして定義される。図3A〜図3Eおよび図4(A)〜(C)を参照されたい。効果的には、切断はノードを連結しているアークを通る。切断、および切断の一方の側に隣接するシームの除去(または挿入)の後、次に新たなアークおよびコストを用いて格子グラフを再連結することができ、新たなコストマップを計算することができる。] 図3A 図3B 図3C 図3D 図3E 図4
[0058] 切断C={S,T}の総コストは、切断される個々のアーク(p,q)のコストの合計として定義される。ただし、p∈Sかつq∈Tである。ここで、コストは、Avidan他による本発明者らの従来の研究におけるように画素ではなく、アークに割り当てられることに留意されたい。コストは前方に向けられた切断に関してのみ合計される。すなわち、後方向におけるアークの無限コストは、切断の総コストに影響を与えない。切断からシームを決定する(130)ために、切断の一方の側、たとえば上端エッジから下端エッジに延在する切断に関して切断部の左側に直接隣接する画素を選択する。]
[0059] グラフ切断は、既知である。グラフ理論において、切断は、グラフの頂点を2つのセットに分割することである。より正式には、G(V,E)がグラフを表すものとする。切断は、頂点Vを2つのセットSおよびTに分割することである。u∈Sかつv∈T(または有向グラフの場合は、u∈Tかつv∈S)の任意のエッジ(u,v)は、切断を横切っており、被切断エッジであるとされる。]
[0060] しかしながら、本発明による方法と従来のグラフ切断との間には、多数の決定的な違いが存在する。従来のグラフ切断は、コンテンツを意識した画像サイズ変更ではなく、テクスチャ統合のために使用されてきた。さらに、従来の格子グラフは、方向性を有しない非常に単純な4連結グラフである。図3Aを参照されたい。このグラフは、本発明による単調性制約条件および連結性制約条件を満たさないため、本発明によるシームカービングに有効なシームを画定しない。] 図3A
[0061] 単調性制約条件
シーム内の画素pの座標iおよびjは、シームの選択された方向、たとえば、下式において単調増加しなくてはならない。]
[0062] ]
[0063] 連結性制約条件
シーム内の画素を表すノードは、隣接し、かつ1つのアークによって直接連結されなくてはならない。すなわち、上記の単調性制約条件において、n=1でなくてはならない。]
[0064] 単調性制約条件および連結性制約条件を組み合わせて、シームを厳密に幅1画素にし、該シームを画像の一方のエッジから画像の真向かいのエッジへ連続的に延在させることができる。]
[0065] したがって、結果としてのシームがこれらの制約条件を満たすことを補償する格子グラフを構築することが課題である。]
[0066] 画像のためのグラフ切断
本発明による格子グラフにおいて、各ノード(画素)Pi,jは、自身の複数の直接近傍に8連結される。L1ノルム勾配量エネルギーE1に続いて、アークのコストを、図3Eに示される水平方向または垂直方向のいずれかにおける、画像内のコストに対応する画素間の前方差分として以下のように定義する。] 図3E
[0067] ]
[0068] 図2は、海辺の滝の入力画像201、および様々なグラフ構築に関して該画像に対して切断された4つのシーム202を示している。4つのシームに対応する可能な分割301が、それぞれ図3A〜図3Dに示されている。各シームは、垂直切断の真左にある画素からなる。水平切断の場合のシームは、切断の真下となる。] 図2 図3A 図3B 図3C 図3D
[0069] 図3A〜3Dにおいて、画像サイズ変更の目的のための異なる複数の可能なグラフ構築が、画像内の4つの隣接する画素を表す4つのノードによって示されている。実際の格子グラフは、これらのグラフを画像全体上に敷きつめることによって構築される。] 図3A 図3B 図3C 図3D
[0070] 図3Aにおける従来のグラフによって、妥当なシームではない一般的なパスが生じる。一方で、図3Bのグラフによって、単調であるが区分的に連結されたシームが生じる。図3のグラフは、Avidan他によるシームカービングに類似している。しかしながら、本発明では、動的プログラミングの代わりに格子グラフを使用する。図3Dのグラフは、本発明の実施の形態による前方コスト関数を表す。図3Eは、本発明による格子グラフをより詳細に示す。] 図3A 図3B 図3D 図3E
[0071] 切断400に単調性制約条件を課すために、水平アーク、垂直アーク、対角アークの異なる方向に異なるコストを使用する。前方アークの場合、すなわちSからTへの方向において、下記で定義するように、コスト+LR321、+LU322、および−LU323を使用する。後方水平アークおよび後方対角アークの場合、無限(∞)コスト320を使用する。本発明による格子グラフにおいて、画像のエッジにおける画素を表すノード以外の各ノードは、最大12個の有向アークによって8個の隣接するノードに連結されることができることに留意されたい。図3Eを参照されたい。] 図3E
[0072] 以下に、本発明によるグラフ構築の下で単調性制約条件が施行される理由を論証する。]
[0073] 本発明によるグラフ切断構築と、Avidan他による従来技術の動的プログラミング手法との間の主な違いは、Avidanは、切断のための画素が連結されるように明示的に制約しないことである。Avidanによるグラフ切断は、いくつかの連続した垂直(または垂直)アークを通り抜け、実際に、区分的に連結されたシームを生成する。]
[0074] 本発明者らは、空間連続性および時間連続性の双方を保持するとともに、視覚的アーチファクトを最小にするために、連続して連結されたシームが重要であると考える。本発明では、切断が連結されるように制約するために、無限コストを有する後方対角アーク415を使用する。]
[0075] シーム制約条件
本発明による格子グラフは、無限コストを有する水平後方アークを使用して単調性を施行する。これは、切断の定義および構築の後に直接続く。終端ノードSは、画素の左端(エッジ)列内の全ての画素に連結されており、右端列の全ての画素が終端ノードTに連結されているため、別個のサブセットSおよびTを生成するために、全ての行は、何らかの場所で切断されなくてはならない。]
[0076] 最適な切断は、各行(または列)を通り抜ける。格子グラフ内に行jが存在し、切断が行j内を2回通ると想定する。実際に、切断は特定の行または列を奇数回切断しなくてはならない。行j内の連続する2つの切断を検討する。]
[0077] ノード(画素)Pi,jはSとラベル付けされ、ノードPi+1,j〜Pkー1,jはTとラベル付けされ、ノードPk,jはSとラベル付けされる。しかしながら、これは、無限コストアークであるPk,j→Pk−1,jが切断に含まれなくてはならないことも意味する。図4(A)〜(C)を参照されたい。これによって、この切断は無限コスト切断となり、最適性に反する。これは、該切断が格子のある列において水平アークのみを切断し、有限コスト切断を達成することが常に可能であるためである。] 図4
[0078] ソースノードSが画像の左端列に連結され、ターゲットノードTが右端列に連結される場合、切断の左側の全てのノードは、Sとラベル付けされ、切断の右側の全てのノードは、Tとラベル付けされる。グラフ切断が同様に連結されることを望む場合には、後進対角アークを使用する。上記と同じ議論によって、図4(A)〜(C)に示すような連結性を論証することができる。] 図4
[0079] 本発明では無限コストを有する後方水平アークおよび後方対角アークを使用するため、本発明による格子グラフは、シーム制約条件を施行する。図4(A)に示すように、水平後方無限アーク402は単調性を施行する。対角無限大アーク415は連結性を施行する。図4(B)に示すように、切断400が複数の画素を左側にスキップするか、または図4(C)に示すように右側にスキップする場合、ソースノード(白)411からターゲットノード(黒)412への無限大コストを有する対角切断は切断されなくてはならない。] 図4
[0080] 実際に、垂直アークおよび水平アークのコストを組み合わせることによって、動的プログラミング法によって見つけられるシームと同等なシームを定義する切断を有するグラフを構築することができる。図3Cを参照されたい。] 図3C
[0081] たとえば、水平前方アークに以下のコスト
C1(i,j)=∂x(i,j)+∂y(i,j)
を割り当て(120)、垂直アークを全体的に除去する。]
[0082] このグラフ内の切断は、単調であり、かつ連結されている。切断は、水平前方アークのみを考慮し、残りの無限コストアークは、連結性制約条件を課し、切断されることができない。したがって、本発明によるコストは、シーム内の全ての画素に関する全てのコストC1(i,j)の合計でもある。]
[0083] したがって、画素に関して定義される任意のエネルギー関数を、前方水平アークのコストとして使用し、動的プログラミングに基づくシームカービングと同じ結果を達成することができる。さらに、顔検出またはユーザによって定義されるコストマスクのような高レベルの機能を、本発明によるグラフ構築のうちの任意のものにおいて使用することができる。本発明では、画素のコストを、画素の外へ延びる水平アークに単に加える。]
[0084] ビデオのためのグラフ切断
ビデオに対する拡張が図5に示されている。本発明では、ほとんど垂直の(または水平の)多様体501を検索し、ビデオボリューム内のX×T平面502を検討し、無限の連結性コストを有する後方対角アークを含む、静止画像のためのX×Y平面と同じグラフ構築を使用する。] 図5
[0085] 水平の場合、全てのフレームに関してそれぞれ、ソースノードおよびターゲットノードを全ての左端ノード、右端ノード、または上端ノード、または下端ノードに関連付ける。3D領域において2D多様体に対して定義されるグラフ切断を使用して、3Dビデオボリュームをソースセットおよびターゲットセットに分割する。そのような切断は、時間においても単調である。これは、各フレーム内の水平制約条件が既に整っているためである。この切断は、空間および時間の双方において、ボリューム内で大域最適である。各フレームに限定されて、切断は、1Dの連結されたシームを画定する。]
[0086] フルビデオボリュームの場合、計算時間は、ノード数とグラフ内のアーク数を乗算したものに依拠し、これは画素数における二次方程式である。全ての画素がノードによって表されるグラフに対する最小の切断を解くことは実現可能でない。効率を上げてリアルタイム処理を可能にするために、格子グラフは、低い解像度から高い解像度まで、複数の解像度において構築される。]
[0087] 適切な最小の切断は、まず解像度が最も低いグラフに関して計算され、次により高い解像度において繰り返し精緻化される。粗大化は、グラフを空間的および時間的の双方でダウンサンプリングすることによって実施され、一方で、精緻化は、より粗いレベルにおいて計算された切断によってもたらされる狭帯域に関して、グラフ切断を計算することによって行われる。本発明の場合、帯域は、時空間ボリュームを切り取る「スリーブ」の形式をとる。]
[0088] シームカービングに対するグラフ切断手法によって、コンテンツを意識したサイズ変更の利点をビデオに拡張すること可能になる。しかしながら、単一コスト関数は、全てのケースにおいて適切に機能するとは限らない。したがって、コンテンツをより良好に保持するとともに、ビデオのためのサイズ変更を改良するコスト関数を提供する。]
[0089] 前方エネルギー
Avidan他による従来技術のサイズ変更によって生じるビデオフレーム内のアーチファクトは、静止画像においても見ることができる。アーチファクトは、従来技術によるサイズ変更が、サイズ変更された画像内に挿入されるエネルギー、すなわち前方エネルギーを無視して、入力画像から最も少量のコストを有するシームを除去するために生じる。挿入されるエネルギーは、画素を除去(または挿入)し、それによって以前は隣接していなかった画素が、シーム適用の後に隣接するようになることに起因する。このため、サイズ変更された画像におけるエネルギー変化は、各シーム除去とともに増加または減少し得る。図6を参照されたい。] 図6
[0090] 本発明の実施の形態によるグラフ切断の実施態様において、画像のコストは、もはや従来技術の画素の属性ではなく、グラフ内のアークの属性である。したがって、画像の総コストは、全ての切断の有限コストの合計であり、各シームのコストは、対応する切断Cのコストである。このため、i番目のシームカービングサイズ変更後のエネルギー差分は、以下である。]
[0091] ]
[0092] ただし、tは時間(フレーム)を表し、Cはシームに対応する切断のコストを表す。]
[0093] エネルギー差分は、実際に、異なる複数のシーム除去に関して増加および減少し得る。本発明は、サイズ変更された画像におけるエネルギー変化を最小にする。]
[0094] 図6は、各シームが除去された後(水平軸)の出力画像における、実際の(正規化された)エネルギー変化ΔE(垂直軸)を示している。変化ΔEの理由は、シームが除去(または挿入)された後、切断の右側(または下側)の画素が新たな隣接する画素を有することである。このため、エネルギーおよびコストが再計算される場合、これらは実際に増加または減少し得る。] 図6
[0095] したがって、最適なシームを選択するための判断基準を提供する。従来技術におけるように、最小コストシームを除去する前の後方の入力画像を注目するのとは対照的に、本発明による判断基準は、前方の出力画像を注目する。]
[0096] 各ステップにおいて、除去されるとき、シームが除去された後のサイズ変更された出力画像におけるエネルギー変化を最小にするシームを検索する。これらのシームは、従来技術におけるように該シームのコスト自体が最小である必要は必ずしもないシームである。]
[0097] まず、静止画像のためのエネルギー関数を説明し、次に、ビデオに対するコスト関数の拡張を説明した。連結されたシームの除去は、画素の局所近傍におけるエネルギーにしか影響を与えないため、除去(または挿入)される画素に隣接する画素の小さな局所領域を調べれば十分である。]
[0098] 特定の画素を除去することによってサイズ変更された画像のエネルギーを、該サイズ変更された画像において生成される新たな「画素境界」に起因するものと考える。切断境界における画素のエネルギーは、シームが除去(または挿入)された後に新たな隣接する画素となる画素間の前方エネルギー差分として測定される。]
[0099] 垂直シームに関して図7(A)〜(C)に示すように、シームの方向、左、上(または下)、および右に依拠して、3つのケースが可能である。シームを除去した後、新たな近傍および新たな画素エッジ702が生成される。各ケースにおいて、コストは新たに生成された画素エッジにおける前方差分によって定義される。行i−1において作成される新たなエッジは、前回の行画素のコストにおいて計上されていたことに留意されたい。] 図7
[0100] 3つの可能なケースのそれぞれについて、それぞれ以下のようにコストを定義する。]
[0101] ]
[0102] ただし、CLは左コストであり、CUは上コストであり、CRは右コストである。図7(A)〜(C)を参照されたい。] 図7
[0103] 累積コストマップM121においてこれらのコストを使用して、シームを決定する。垂直シームの場合、各コストM(i,j)は、以下の関数を使用して更新される。]
[0104] ]
[0105] ただし、P(i,j)は、高レベルのタスク、たとえば顔検出器またはユーザコストから得られる結果のような付加的ベースのコスト測定であり、本発明による前方コストに加えて使用することができる。]
[0106] グラフ切断における前方コスト
グラフ切断の前方コストを求めるために、アークコストが、3つの可能なシーム方向に従って特定の画素を除去することによって引き起こされるコストを定義するグラフを構築する。]
[0107] 3つの全てのケースにおいて、新たな水平画素境界pi,j−1pi,j+1が生成される。これは、太線で示されるように、画素pi,jが除去されるためである。したがって、pi,j−1およびpi,j+1を表すノード間のグラフアークに、左近傍と右近傍との間のコスト差分321を以下のように割り当てる。]
[0108] ]
[0109] 上記で説明したようなシーム単調性制約条件を施行するために、ノードpi,j+1およびpi,jを、無限コストを有する後方アークと連結する。また、無限コストを有する対角後方アークを加え、連結性を保持する。]
[0110] 次に、新たな垂直画素エッジに起因するコストを計上する。図7(B)に示すような垂直シームステップの場合、新たな垂直エッジは存在せず、このためコストは一切挿入されない。ここで、切断部の左側の全てのノードは、Sとラベル付けされ、切断部の右側の全てのノードは、Tとラベル付けされている。] 図7
[0111] 定義によって、切断のコストは、Sとラベル付けされるノードからTとラベル付けされるノードに向けられるアークしか考慮しない。したがって、図7(A)に示すように、右に配向された切断部において上方向の垂直アークのみがカウントされ、図7(C)に示すように、左に配向された切断部において下方向の垂直アークのみがカウントされるということになる。したがって、画素pi,jおよびpi−1,j間の上方向の垂直アークに、左近傍および上近傍間のコスト差分322を以下のように割り当てる。] 図7
[0112] ]
[0113] そして、画素pi−1,jおよびpi,j間の下方向の垂直アークに、コスト差分323を以下のように割り当てる。]
[0114] ]
[0115] ただし、−LUは、矢印の終点に対する左近傍と上近傍との間の差分を意味する。]
[0116] 図8(A)〜図8(B)は、図8(A)の入力画像からの、従来技術の後方コスト関数を使用するシーム除去と、本発明による前方エネルギー関数を使用するシーム除去との間の劇的な差異を示している。従来技術のよる出力画像図8(B)では、ベンチに座っている人物は著しく歪み、フェンスの支柱のうちの1本が大幅に細くなっている。図8(C)の出力画像では、これらのアーチファクトのうちのいずれも存在しない。] 図8
[0117] 図9(A)および図9(B)は、対応するシームを示している。ここで、図9(B)では人物および支柱を通る切断がより少ない。これは、本発明の前方エネルギーシームがより良好であることを明白に示している。] 図9
[0118] 図10(A)および図10(B)は、それぞれのコストマップを示している。これらは、顕著なコンテンツに起因するコストが、図10(B)に示すように本発明のコストマップにおいてより良好に保持されていることを明白に示している。図10(A)に示すように、コストはベンチ上の全てのバーを横切る毎に増加する。これは、バーが画像内のエッジを画定しているためである。図10(B)において、垂直シームは、出力画像におけるコストを大幅に増加させることなくバーを横断することができる。] 図10
[0119] ビデオの場合、シーム方向に依拠して3Dビデオボリューム内のスライスを調べる。垂直シーム、すなわちY方向の場合、(X×T)次元上の全てのスライスとシームとの共通部分によって、その平面上のシームが作成される。したがって、全ての画素除去のコストを、該画素が除去されるときにビデオ内にもたらされる、時間方向においてフレーム間で生成される新たな時間画素エッジとして定義する。次に、空間X×Y領域におけるような適切なコストを有する、グラフ内のノード間のアークおよび時間ステップ(フレーム)間のアークを生成する。]
[0120] 上記で説明したように、顕著性マップ、オブジェクト検出器、および手作業で挿入されたエネルギーのような他のエネルギー関数も、本発明によるサイズ変更とともに使用することができる。大きなエネルギーを有する画素をマーク付けすることによって、ユーザは、サイズ変更プロセス中に、ビデオの特定の部分を保護することができる。本発明による手法は、大域的であるため、ユーザは全てのフレームをマーク付けする必要はなく、k個のフレーム毎に1回マーク付けすればよい。実際には、10個のフレーム毎にマーク付けする。負のコストを供給することによって、ユーザは、たとえばオブジェクト除去のために、シームをビデオの所望の部分に誘引することができる。]
[0121] 本発明による前方エネルギー判断基準によって、画像またはビデオのコンテンツおよび構造が保持される。しかしながら、構造を施行することは、時によってコンテンツを犠牲にして成り立ち得る。たとえば、目立ったアーチファクト、すなわち挿入されるコストなしでサイズ変更され得る重要なオブジェクトは、サイズ変更中に危険にさらされる場合がある。そのようなケースでは、前方判断基準とコストE1とを組み合わせることが、より良好な結果を達成するのに役立ち得る。これは、コストE1がコンテンツをより良好に保護することができるためである。]
[0122] 本発明を特定の好ましい実施の形態を参照して説明してきたが、様々な他の適合および変更を本発明の精神および範囲内で行うことができることを理解されたい。したがって、添付の特許請求の範囲の目的は、本発明の真の精神および範囲内に入るような全ての変形および変更を包含することである。]
权利要求:

請求項1
画像をサイズ変更するための方法であって、格子グラフは、入力画像内の画素毎に1つのノードを含み、該格子グラフ内の隣接するノードは、アークによって連結され、各該アークは、有向であるとともにコストに関連付けられることで、入力画像から格子グラフを構築するステップと、コスト関数を使用して前記格子グラフの前記アークに切断を適用するステップと、画像のシーム内の画素は、前記切断の一方の側に直接隣接する、前記格子グラフ内のノードに対応し、前記画像のシーム内の前記画素の座標は、単調性制約条件および連結性制約条件を施行することで、前記切断から画素のシームを決定するステップと、出力画像を生成するために、前記入力画像と比較されるときの、前記出力画像内のエネルギー変化を最小にしながら、前記シームに従って前記入力画像をサイズ変更するステップとを含む方法。
請求項2
前記格子グラフは、画像の時間シーケンスから構築され、該格子グラフは、3次元であり、前記シームは、前記格子グラフの空間次元xおよびy、ならびに時間次元tにおいて多様体を形成する請求項1に記載の方法。
請求項3
前記エネルギーは、画素の強度に基づき、前記コストは、エネルギー関数によって求められる請求項2に記載の方法。
請求項4
前記エネルギー関数は、局所的な強度変化を考慮する請求項3に記載の方法。
請求項5
前記アークの前記コストを使用して、前記単調性制約条件および前記連結性制約条件を施行するステップをさらに含む請求項1に記載の方法。
請求項6
前記最小にすることは、以下のように表され、ただし、Eはエネルギー関数であり、IIは入力画像であり、IOは出力画像であり、Ciは前記切断に関連付けられるコストを有する画素のシームである請求項1に記載の方法。
請求項7
前記出力画像をレンダリングするステップをさらに含む請求項1に記載の方法。
請求項8
前記エネルギーは、空間L1ノルム勾配量エネルギーEspatialを、時間勾配量エネルギーEtemporalと結合して、以下に従って時空間L1ノルム勾配量エネルギーEglobalを生成し、ただし、It(i,j)は画素に対応し、tは時間を表し、パラメータα∈[0,1]は空間コスト寄与と時間コスト寄与とを平衡させる請求項1に記載の方法。
請求項9
前記格子グラフ内の各前記ノードは、無限コストを有するアークによって他のノードに連結される請求項1に記載の方法。
請求項10
複数のシームを決定するステップと、前記複数のシームに従って前記入力画像をサイズ変更するステップとをさらに含む請求項1に記載の方法。
請求項11
前記切断の総コストCは、切断される前記アークの前記コストの合計である請求項1に記載の方法。
請求項12
前記シーム内の前記画素pの前記座標iおよびjは、前記シームの選択された方向において単調増加し、[Pi,j→Pi+1,j]、[Pi,j→Pi,j+1]、または[Pi,j→Pi+1,j+1]に従って直接隣接する請求項1に記載の方法。
請求項13
前記単調性制約条件および前記連結性制約条件は、前記シームを厳密に幅1画素にし、該シームを前記入力画像の一方のエッジから該入力画像の真向かいのエッジへ連続的に延在させる請求項1に記載の方法。
請求項14
前記格子グラフを粗い解像度から精緻な解像度までの複数の解像度で構築するステップと、前記格子グラフ上の前記切断を最も低い解像度を用いて概算し、次に該切断をより高い解像度で精緻化するステップとをさらに含む請求項1に記載の方法。
請求項15
前記シーム内の前記画素は、前記入力画像から除去され、より小さな出力画像が生成される請求項1に記載の方法。
請求項16
前記シーム内の前記画素は、前記入力画像内で複製され、より大きな出力画像が生成される請求項1に記載の方法。
請求項17
前記切断のコストを最小にするステップをさらに含む請求項1に記載の方法。
类似技术:
公开号 | 公开日 | 专利标题
US9443555B2|2016-09-13|Multi-stage production pipeline system
JP2019525515A|2019-09-05|マルチビューシーンのセグメンテーションおよび伝播
Battisti et al.2015|Objective image quality assessment of 3D synthesized views
US8791941B2|2014-07-29|Systems and methods for 2-D to 3-D image conversion using mask to model, or model to mask, conversion
US20150254868A1|2015-09-10|System and methods for depth regularization and semiautomatic interactive matting using rgb-d images
Wang et al.2004|Video tooning
CN103168315B|2016-01-20|手持式设备上的立体|全景图创建
EP2033164B1|2015-10-07|Methods and systems for converting 2d motion pictures for stereoscopic 3d exhibition
Xiong et al.2010|Fast panorama stitching for high-quality panoramic images on mobile phones
US7173620B2|2007-02-06|Image display method and image display device
US8036451B2|2011-10-11|Creating a depth map
US8581961B2|2013-11-12|Stereoscopic panoramic video capture system using surface identification and distance registration technique
Lu et al.2011|A revisit to MRF-based depth map super-resolution and enhancement
US7760956B2|2010-07-20|System and method for producing a page using frames of a video stream
Shamir et al.2009|Visual media retargeting
Segall et al.2003|High-resolution images from low-resolution compressed video
TWI455597B|2014-10-01|利用全彩影像之雜訊減低彩色影像
Agarwala et al.2006|Photographing long scenes with multi-viewpoint panoramas
KR101625830B1|2016-05-31|깊이 맵을 생성하기 위한 방법 및 디바이스
US7633511B2|2009-12-15|Pop-up light field
US6466618B1|2002-10-15|Resolution improvement for multiple images
US8401336B2|2013-03-19|System and method for rapid image sequence depth enhancement with augmented computer-generated elements
US7809212B2|2010-10-05|Digital mosaic image construction
US8102406B2|2012-01-24|Method and system for producing a video synopsis
US6741725B2|2004-05-25|Motion tracking using image-texture templates
同族专利:
公开号 | 公开日
US20110211771A1|2011-09-01|
JP5058341B2|2012-10-24|
EP2218056A1|2010-08-18|
CN101981592A|2011-02-23|
EP2218056B1|2013-05-29|
US8380010B2|2013-02-19|
EP2218056A4|2012-05-30|
CN101981592B|2013-02-06|
WO2009070449A1|2009-06-04|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
JP2007267384A|1997-05-01|2007-10-11|Ricoh Co Ltd|圧縮装置及び圧縮方法|
JP2003242497A|2002-01-10|2003-08-29|Ricoh Co Ltd|低解像度画像作製方法及び装置|
WO2007016301A2|2005-07-28|2007-02-08|Microsoft Corporation|Image blending|JP2011166498A|2010-02-10|2011-08-25|Hitachi Ltd|立体映像調整装置及び調整方法|
KR101261498B1|2011-11-11|2013-05-13|단국대학교 산학협력단|그래프 래티스구조 변환방법 및 변환시스템|US6563964B1|1999-02-08|2003-05-13|Sharp Laboratories Of America, Inc.|Image downsampling using redundant pixel removal|
US7308198B1|2001-05-16|2007-12-11|Tellabs Operations, Inc.|Method for allocating protection bandwidth in a telecommunications mesh network|
US20050131660A1|2002-09-06|2005-06-16|Joseph Yadegar|Method for content driven image compression|
US7602398B2|2005-01-28|2009-10-13|Microsoft Corporation|Decorating surfaces with textures|
US7822274B2|2006-01-17|2010-10-26|Siemens Medical Solutions Usa, Inc.|Banded graph cut segmentation algorithms with laplacian pyramids|
US7778491B2|2006-04-10|2010-08-17|Microsoft Corporation|Oblique image stitching|
US7747107B2|2007-03-06|2010-06-29|Mitsubishi Electric Research Laboratories, Inc.|Method for retargeting images|
US7800627B2|2007-06-08|2010-09-21|Microsoft Corporation|Mesh quilting for geometric texture synthesis|US8472753B2|2008-01-10|2013-06-25|Samsung Electronics Co., Ltd.|Method and system of adaptive reformatting of digital image|
US9305389B2|2008-02-28|2016-04-05|Autodesk, Inc.|Reducing seam artifacts when applying a texture to a three-dimensionalmodel|
US8269765B2|2008-02-28|2012-09-18|Autodesk, Inc.|System and method for removing seam artifacts|
US8280186B1|2008-07-31|2012-10-02|Adobe Systems Incorporated|Seam-based reduction and expansion of images with table-based priority|
US8265424B1|2008-07-31|2012-09-11|Adobe Systems Incorporated|Variable seam replication in images with energy-weighted priority|
US8218900B1|2008-07-31|2012-07-10|Adobe Systems Incorporated|Non-linear image scaling with seam energy|
US8270765B1|2008-07-31|2012-09-18|Adobe Systems Incorporated|Hybrid seam carving and scaling of images with configurable energy threshold|
US8280187B1|2008-07-31|2012-10-02|Adobe Systems Incorporated|Seam carving and expansion of images with color frequency priority|
US8270766B1|2008-07-31|2012-09-18|Adobe Systems Incorporated|Hybrid seam carving and scaling of images with configurable carving tolerance|
US8280191B1|2008-07-31|2012-10-02|Abode Systems Incorporated|Banded seam carving of images with pyramidal retargeting|
US8290300B2|2008-07-31|2012-10-16|Adobe Systems Incorporated|Seam-based reduction and expansion of images with color-weighted priority|
US8625932B2|2008-08-28|2014-01-07|Adobe Systems Incorporated|Seam carving using seam energy re-computation in seam neighborhood|
US8180177B1|2008-10-13|2012-05-15|Adobe Systems Incorporated|Seam-based reduction and expansion of images using parallel processing of retargeting matrix strips|
US8581937B2|2008-10-14|2013-11-12|Adobe Systems Incorporated|Seam-based reduction and expansion of images using partial solution matrix dependent on dynamic programming access pattern|
US8270771B2|2008-12-09|2012-09-18|Xerox Corporation|Iterative selection of pixel paths for content aware image resizing|
US8290298B2|2009-01-20|2012-10-16|Mitsubishi Electric Research Laboratories, Inc.|Method for temporally editing videos|
US8290297B2|2009-01-20|2012-10-16|Mitsubishi Electric Research Laboratories, Inc.|Method for editing images and videos|
US8358876B1|2009-05-20|2013-01-22|Adobe Systems Incorporated|System and method for content aware in place translations in images|
US8963960B2|2009-05-20|2015-02-24|Adobe Systems Incorporated|System and method for content aware hybrid cropping and seam carving of images|
KR20120049245A|2009-07-06|2012-05-16|코닌클리케 필립스 일렉트로닉스 엔.브이.|오버레이 그래픽을 갖는 이미지의 리타겟팅|
US8345974B2|2009-07-14|2013-01-01|Hewlett-Packard Development Company, L.P.|Hierarchical recursive image segmentation|
CN101609547B|2009-07-16|2011-12-07|复旦大学|基于累积能量的无缝拼接图像处理方法|
JP2011039801A|2009-08-12|2011-02-24|Hitachi Ltd|画像処理装置および画像処理方法|
US8659622B2|2009-08-31|2014-02-25|Adobe Systems Incorporated|Systems and methods for creating and editing seam carving masks|
US8373802B1|2009-09-01|2013-02-12|Disney Enterprises, Inc.|Art-directable retargeting for streaming video|
US9330434B1|2009-09-01|2016-05-03|Disney Enterprises, Inc.|Art-directable retargeting for streaming video|
US8717390B2|2009-09-01|2014-05-06|Disney Enterprises, Inc.|Art-directable retargeting for streaming video|
WO2011121563A1|2010-04-01|2011-10-06|Koninklijke Philips Electronics N.V.|Detecting saliency in an image|
CN101923703B|2010-08-27|2012-09-05|北京工业大学|基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法|
JP5772446B2|2010-09-29|2015-09-02|株式会社ニコン|画像処理装置及び画像処理プログラム|
US8994742B2|2011-10-18|2015-03-31|3D Systems, Inc.|Systems and methods for seam resolution|
CN104813361B|2012-12-17|2018-09-28|英特尔公司|感知内容的视频尺寸调整|
EP2939180A4|2012-12-28|2016-08-17|Intel Corp|Content aware video resizing|
US8873887B2|2013-01-24|2014-10-28|Google Inc.|Systems and methods for resizing an image|
JP2014225718A|2013-05-15|2014-12-04|ソニー株式会社|画像処理装置および画像処理方法|
CN103327261B|2013-06-04|2016-07-13|北京工业大学|一种简单快速的视频重定向方法|
US9384412B2|2013-08-29|2016-07-05|Samsung Electronics Co., Ltd.|Method and apparatus, computer-readable medium for content aware multimedia resizing|
US9769424B2|2013-10-24|2017-09-19|Telefonaktiebolaget Lm Ericsson |Arrangements and method thereof for video retargeting for video conferencing|
US20190163725A1|2016-07-28|2019-05-30|Hewlett-Packard Development Company, L.P.|Document content resizing|
WO2018023332A1|2016-08-01|2018-02-08|Hewlett-Packard Development Company, L.P.|Data connection printing|
US10504283B2|2018-03-16|2019-12-10|Here Global B.V.|Method and apparatus for regularizing building footprints using taxicab distance|
法律状态:
2012-02-27| A977| Report on retrieval|Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120227 |
2012-03-14| A131| Notification of reasons for refusal|Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120313 |
2012-04-13| A521| Written amendment|Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120412 |
2012-06-28| TRDD| Decision of grant or rejection written|
2012-07-04| A01| Written decision to grant a patent or to grant a registration (utility model)|Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120703 |
2012-07-05| A01| Written decision to grant a patent or to grant a registration (utility model)|Free format text: JAPANESE INTERMEDIATE CODE: A01 |
2012-08-09| A61| First payment of annual fees (during grant procedure)|Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120731 |
2012-08-10| FPAY| Renewal fee payment (event date is renewal date of database)|Free format text: PAYMENT UNTIL: 20150810 Year of fee payment: 3 |
2012-08-10| R150| Certificate of patent or registration of utility model|Ref document number: 5058341 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
2015-07-28| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2016-07-26| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2017-07-25| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2018-07-24| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2019-07-23| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2020-07-13| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2021-07-12| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
优先权:
申请号 | 申请日 | 专利标题
[返回顶部]